NOPE LinkedIn

Articles dans Catastrophic Forgetting...

Catégories:
Blog

Affiner sans Oublier : Itération Continue et Mémoire du LoRA

Affiner sans Oublier : Itération Continue et Mémoire du LoRA Dans les articles précédents, nous avons posé les fondations : générer des traces ReAct de qualité, entraîner efficacement avec QLoRA et Unsloth, orchestrer les agents sur du matériel réel. Mais une question reste entière : que se passe-t-il quand le premier agent certifié n’est pas assez bon ? C’est le lot commun du fine-tuning sur domaine étroit. Un premier run d’entraînement produit un agent fonctionnel, mais la validation fonctionnelle — le vrai test, pas la loss — révèle des angles morts. Read More...

Tagged LoRA, Fine-tuning, MLOps, PEFT, Itération, Catastrophic Forgetting, Validation, SFT, Cybersécurité